- R语言的特征(跳过)
- R使用流程与工具箱
- 演示:基础操作与数据分析流程
- 使用github获得最新讲义
- R入门方式与资料
2018年
Chester Ismay
改变默认语言(建议设定为英文)
etc\Rconsole文件,language = en.Renviron,LANGUAGE=en查询当前工作目录getwd() 改变默认工作目录 setwd("D:/work")
注意Mac与Windows电脑路径表达差异
通过菜单file->reopen with encoding,简体中文通常可尝试选择gb2312解决
自动生成的模板文件已经设定了头部yaml
简单的文本和代码以及相关操作说明。
通过cmd+op+I插入代码。
简单的标记语法(记得带空格)
技巧:可以将一个语法手册放在手边,随时参考 .
| 设定 | 效果 |
|---|---|
| include=FALSE | 代码可以执行,报告(html、word)中不出现代码和结果,但是运行的结果存在workspace中,可以直接调用 |
| echo = FALSE | 执行代码,打印结果,但是不打印代码~即最终报告中出现的结果,没有代码 |
| evalue = FALSE | 不执行代码,仅呈现 |
| message = FALSE | 执行代码,打印代码,不打印结果 |
| warning = FALSE | 执行代码,不打印出warning的信息 |
| fig.cap = "…" | 输出图形结果时添加标题 |
| fig.width / fig.height | 设定输出图大小 |
编辑完成之后可以通过Rstudio上的Knit按钮进行转码打印
呈现全球国家的预期寿命(life expectancy)和人均GDP(GDP per capita)之间的关系. Hans Rosling曾经做个一个TED演讲。
下面将使用 dplyr包 (用于数据处理 data wrangling) 和 ggplot2 (用于作图,visualization) .
首先要确保这些包都安装了(installed).
在markdown中加载(Load)这些包:
library(dplyr) library(ggplot2)
# gapminder <- read.csv("https://stat.duke.edu/~mc301/data/gapminder.csv")
# setwd("/Users/liding/E/Bdata/liding17/2017R/lesson3/")
gapminder <- read.csv("../data/gapminder.csv")
以gapminder 数据集(dataset)开始
选择年份(year)变量等于2007的案例
将筛选出来的案例存到一个新的数据集gap07
gap07 <- gapminder %>% filter(year == 2007)
任务: 呈现 gdpPercap 与lifeExp之间的关系.
qplot(x = gdpPercap, y = lifeExp, data = gap07)
任务: 各个大陆的点使用不同的颜色.
qplot(x = gdpPercap, y = lifeExp, color = continent, data = gap07)
任务: 在设定点的大小与人口规模成正比.
qplot(x = gdpPercap, y = lifeExp, color = continent, size = pop,data = gap07)
#library(dplyr)
library(gganimate)
library(ggplot2)
library(readr)
# gapminder <- read_tsv("gapminderDataFiveYear.tsv")
gapminder <- read.csv("../data/gapminder.csv")
gapminder <- subset(gapminder,gdpPercap<60000)
gapminder_plot <- ggplot(gapminder) +
aes(x = gdpPercap, y = lifeExp, colour = continent, size = pop,
frame = year) +
geom_point(alpha = 0.6) +
theme(aspect.ratio=9/16) +theme_bw()
gganimate(gapminder_plot,
convert='gm convert',ani.width = 960, ani.height = 540,interval=1.5,
filename = "../pic/gapminder-gganimate.gif")
选择windows或者mac版本。
登录之后
将更新的讲义复制粘贴到另外的文件夹,添加笔记,进行修改。
不直接改动复制下来的文件夹。下次点击更新即可获得最新的讲义。
大家也可以创建自己的版本库,将自己更改后的讲义分享到github上。
管道操作符 %>% 是Stefan Milton Bache and Hadley Wickham在magrittr中首创的.
将上一段命令的结果作为下一行命令的首个默认输入元素,从而可以:
| 命令 | 功能 |
|---|---|
help.start() |
打开帮助文档首页 |
help("foo")或?foo |
查看函数foo的帮助(引号可以省略) |
help.search("foo")或??foo |
以foo为关键词搜索本地帮助文档 |
example("foo") |
函数foo的使用示例(引号可以省略) |
RSiteSearch("foo") |
以foo为关键词搜索在线文档和邮件列表存档 |
apropos("foo", mode="function") |
列出名称中含有foo的所有可用函 |
data() |
列出当前已加载包中所含的所有可用示例数据集 |
vignette() |
列出当前已安装包中所有可用的vignette文档 |
vignette("foo") |
为主题foo显示指定的vignette文档 |
其他资料
tidydata简介: http://www.jstatsoft.org/v59/i10/paper
tidyverse的学习网址:https://www.tidyverse.org/learn/
Rmarkdown撰写的书籍:https://bookdown.org/home/
Data visualisation示例章的概要展示和作业说明